Optimisasi Konveks: Dari Kemungkinan Statistik ke Program Konveks

Inferensi statistik bertanya: "Diberikan data ini, apa parameter tersembunyi yang paling mungkin?" Slide ini menghubungkan pertanyaan tersebut dengan Optimisasi Konveks. Kami mengubah konsep kemungkinan probabilitas menjadi program terstruktur, menunjukkan bahwa dalam kondisi log-konkaf, mencari estimasi terbaik setara dengan menyelesaikan masalah optimisasi konveks.

Kerangka Kemungkinan

The fungsi kemungkinan adalah distribusi probabilitas $p_x(y)$ yang dipandang sebagai fungsi dari parameter $x$ untuk sampel teramati tetap $y$. Untuk memperkirakan $x$, kita menggunakan estimasi Maximum Likelihood (ML): memilih nilai yang membuat data yang diamati paling mungkin terjadi.

$$\hat{x}_{ml} = \text{argmax}_x p_x(y) = \text{argmax}_x l(x)$$

Untuk efisiensi komputasi, kita menggunakan fungsi log-kemungkinan, $l(x) = \log p_x(y)$. Karena logaritma adalah fungsi yang monoton meningkat, ia mempertahankan lokasi maksimum sambil mengubah hasil kali (dari pengamatan independen) menjadi jumlah yang mudah dikelola.

Program Optimisasi MLE (7.1)

Kami merumuskan perkiraan sebagai program matematis:

$$\begin{array}{ll} \text{maksimalkan} & l(x) = \log p_x(y) \\ \text{dengan syarat} & x \in C \end{array}$$ (7.1)

Program ini adalah masalah optimisasi konveks jika:

Fungsi log-kemungkinan $l$ adalah konkaf untuk setiap nilai $y$.
Himpunan layak $C$ (informasi awal) dideskripsikan oleh kendala kesamaan linier dan kendala ketidaksamaan konveks.

Mengintegrasikan Kendala dan Informasi Awal

Estimasi ML membutuhkan definisi ulang $p_x(y)$ menjadi nol untuk $x \notin C$ agar secara eksplisit menerapkan kendala fisik atau informasi awal. Dalam ruang optimisasi, ini berarti fungsi log-kemungkinan diberi nilai $-\infty$ untuk parameter $x$ yang melanggar kendala ini, secara efektif menciptakan rintangan tak terlewati bagi optimizer.

🎯 Prinsip Utama

Transisi dari "Maximum Likelihood" ke "Program Konveks" bergantung pada konkafitas log-densitas. Jika gangguan atau distribusi bersifat log-konkaf, estimasi statistik menjadi tugas optimisasi yang dapat diselesaikan secara global.

PERTANYAAN 1

Mengapa fungsi log-kemungkinan $l(x)$ lebih disukai daripada fungsi kemungkinan $p_x(y)$ untuk optimisasi?

Ini mengubah lokasi maksimum ke titik yang lebih stabil.

Ini adalah fungsi yang monoton meningkat yang mengubah hasil kali menjadi jumlah.

Ini memastikan masalah selalu linear.

Ini menghilangkan kebutuhan akan kendala.

PERTANYAAN 2

Dalam kondisi apa masalah MLE (7.1) dianggap sebagai masalah optimisasi konveks?

Ketika $p_x(y)$ adalah fungsi linier dari $x$.

Ketika $l(x)$ konveks dan $C$ adalah himpunan apa pun.

Ketika $l(x)$ konkaf dan $C$ didefinisikan oleh kesamaan linier dan ketidaksamaan konveks.

Hanya ketika gangguannya berdistribusi Gaussian.

PERTANYAAN 3

Jika suatu parameter $x$ melanggar kendala informasi awal ($x \notin C$), nilai apa yang diberikan kepada log-kemungkinan?

$+\infty$

$-\infty$

PERTANYAAN 4

Benar atau Salah: MLE untuk densitas log-konkaf dengan kendala konveks selalu memiliki maksimum global unik jika ada.

Benar

Salah

PERTANYAAN 5

Pertimbangkan distribusi eksponensial dengan parameter $\lambda$. Jika kita tahu $\lambda \ge 5$ tetapi data menunjukkan $\lambda = 2$, di mana letak MLE terbatas?

Di $\lambda = 2$

Di $\lambda = 5$

Masalah ini tidak memiliki solusi.

Di $\lambda = 0$